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(57) Abstract 

The invention relates to a method for synchro- 
nization and reconfiguration of configurable elements 
in components with two-dimensional or multidimen- 
sional programmable cell structure (DFP, FPGA, 
DPGA, RAW machine) as well as to the control of 
conditioned branches in common microprocessors, 
digital signal processors and microcontrollers. Ac- 
cording to said method, synchronization signals are 
generated during processing within the data flow by 
the elements that are to be processed and configured 
by means of comparisons, algebraic signs, transmis- 
sion of arithmetic operations, error status or the like, 
and are sent to additional elements for synchroniza- 
tion via the data bus. Configuration words within a configurable element are generated from the data flow on the basis of corresponding 
commands and communicated, along with the address of the register to be picked up, to a further configurable element via the data bus, 
wherein said element is thus (re)conflgured without the influence of an external load logic. A valid configuration of die configurable 
elements from a plurality of configurations or a valid command from multiple possible commands of an arithmetic processing unit is then 
selected during running time on the basis of synchronization signals. 
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(57) Zusammenfassung 

Bei einem Verfahren zur Synchronisation und Umkonfiguration von konfigurierbaren Elementen in Bausteinen mit zwei- oder 
mehrdimensionaler programmierbarcr Zellstruktur (DFP, FPGA, DPGA, RAW- Machines), sowie zur Steuerung bedingter Sprunge in 
ublichen Mikroprozcssorcn, Digitalcn Signalprozessoien und Mikrokontrollcm wcrdcn Synchronisationssignalc wahncnd der Verarbeitung 
inncrhalb des Datenstromes von den verarbeitendcn konfigurierbarcn Elementen durch Vergleiche, Vorzeichen, Obertrage von arithmetischen 
Operationen, Fehlerzustanden, u.dgl., generiert und an weitere Elemente zur Synchronisation Qber den Datenbus gesandt Aus dem 
Datenstrom heraus werden anhand entsprechender Befehle Konfigurationsworter innerhalb eines konfigurierbarcn Elementes generiert und 
tlber den Datenbus zusammen mit der Adresse des anzusprechenden Registers an ein weiteres konngurierbares Element Gbertragen, wobei 
dieses dadurch ohne den EinfluB einer extemen Ladelogik (um)konfiguriert wird. Zur Laufzeit anhand von Synchronisationssignalen wird 
eine gQltige Konfiguration der konfigurierbarcn Elemente aus einer Mehrzahl an Konfigurationen oder ein gultiger Befehl aus mehreren 
mdglichen Befehlen eines Rechenwerkes ausgewahlt 
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Verfahren zur Selbstsynchronisation von konf igurierbaren 
Elementen eines programmierbaren Bausteines 

1. Hintergrund der Erfindung 
1.1 Stand der Technik 

1.1.1 Probleme 

Bei heutigen Bausteinen (FPGA, DPGA etc.) wird die 
Synchronisation der konfigurierbaren Elemente meistens durch 
dexi Takt des Bausteines hergestellt. Diese Art der zeitlich 
gesteuerten Synchronisation bereitet viele Probleme, da oft 
nicht im Vorhinein bekannt ist, wie lange eine Aufgabe 
benBtigt, bis ein gtlltiges Ergebnis bereit steht. Ein weiteres 
Problem der zeitgesteuerten Synchronisation ist, dafi das 
Ereignis auf welches die Synchronisation erfolgt nicht von dem 
zu synchronisierenden Element selbst ausgelGst wird, sondern 
von einem unabhangigem Element. In diesem Fall sind nun zwei 
verschiedene Elemente an der Synchronisation beteiligt. Dies 
ftthrt zu einem erheblich h&hrem Verwaltungsaufwand. 

1.1.2 Verbesserung durch die Erfindung 

Durch die Erfindung wird ein Verfahren beschrieben, welches es 
gestattet, dafi die Synchronisation von zu synchronisierenden 
Elementen selbst ausgeht. Die Synchronisation ist nicht mehr 
durch eine zentrale Instanz implementiert und wird auch nicht 
mehr durch eine zentrale Instanz verwaltet. Durch die Verlegung 
der Synchronisation in jedes Element kdnnen auch viel mehr 
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Synchronisationsaufgaben gleichzeitig durchgeftthrt werden, da 
unabhangige Elemente sich nicht mehr gegenseitig beim Zugriff 
auf die zentrale Synchronisations-Instanz behindern. Die 
Einzelheiten und besondere Ausgestaltungen, sowie Merkmale des 
erfindungsgemaBen Synchronisationsverfahrens sind Gegenstand 
der Patentansprtiche . 

2. Beschreibung der Erfindung 

2.1 Obersicht ttber die Erfindung, Abstrakt 

In einem Baustein mit zwei- oder mehrdimensional angeordneter, 
programmierbarer Zellstruktur (DFP, DPGA) kann jedes 
kcnf igurierbare Element iiber eine Vernetzungsstruktur auf die 
Konf igurations- und Statusregister der anderen konf igurierbaren 
Elemente zugreifen und damit deren Funktion und Arbeitsweise 
aktiv beeinf lussen. Die Konf iguration kann somit zusatzlich zu 
der Ublichen Methode durch eine Ladelogik aus dem 
ProcessingArray (PA vgl. P19651075.9) heraus erfolgen. 

2.2 Detailbeschreibung der Erfindung 

Es wird von einem frei zur Laufzeit programmierbaren Baustein 
ausgegangen, welcher zus^tzlich zur Laufzeit rekonf iguriert 
werden kann. Die auf dem Chip enthaltenen konf igurierbaren 
Elemente besitzen ein oder mehrere Konf igurationsregister ftlr 
verschiedene Aufgaben. Auf diese Konf igurationsregister kann 
lesend wie schreibend zugegriffen werden. In dem beschriebenen 
Verfahren wird davon ausgegangen, daB fUr folgende 
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Informationen eine Konf iguration in einem zu konf igurierenden 
Element eingestellt werden kann. 

- Vernetzungs-Register . In diesem Register wird die Art der 
Verbindung zu anderen Zellen eingestellt. 

- Befehls-Register . In diesem Register wird die auszufiihrende 

Funktion des konf igurierbaren Elements eingetragen. 

- Status-Register. In diesem Register speichert die Zelle ihren 
aktuellen Zustand. Dieser Zustand gibt anderen Elementen des 
Bausteins Auskunft dartiber, in welchem Verarbeitungszyklus 
sich die Zelle befindet. 

Eine Zelle wird durch einen Befehl konf iguriert, welcher die 
Funktion der Zelle bestimmt, die ausgefiihrt werden soli. 
Weiterhin werden Konf igurationsdaten eingetragen urn die 
Vernetzung mit anderen Zellen und den Inhalt des Status- 
Registers einzustellen. Nach diesem Vorgang ist die Zelle 
betr iebsbereit . 

Urn eine flexible und dynamische Zusammenarbeit vieler Zellen zu 
ermoglichen, kann jede Zelle auf alle Konf igurationsregister 
einer anderen Zelle lesend oder schreibend zugreifen. Auf 
welches der vielen Konf igurationsregister lesend oder 
schreibend zugegriffen wird, wird durch die Art des Befehls, 
mit welchem die Zelle konf iguriert wurde, festgelegt. Jeder 
Befehl den die Zelle ausfiihren kann, existiert in soviel 
verschiedenen Adressierungsarten, wie es verschiedehe, 
voneinander unabh&ngige Konf igurationsregister, in einem zu 
kcnf igurierenden Element gibt. 
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Beispiel: Eine Zelle besitzt die oben angegebenen 
Konf igurationsregister (Vemetzung, Befehl und Status) und soli 
den Befehl ADD, welcher eine Addition durchfiihrt ausfUhren. 
Durch die verschiedenen Arten des ADD Befehls kann nun 
selektiert werden, wohin das ergebnis dieser Funktion 
Ubertragen wird. 

ADD-A. Das Ergebnis wird an das Operand-Register-A der 

Zielzelle Ubertragen. 
ADD-B. Das Ergebnis wird an das Operand-Register-B der 

Zielzelle Ubertragen. 
ADD-V. Das Ergebnis wird an das Vernetzungs-Register der 

Zielzelle ubertragen. 
ADD-S. Das Ergebnis wird an das Status-Register der Zielzelle 

Ubertragen. 

ADD-C. Das Ergebnis wird an das Befehls-Register der Zielzelle 
Ubertragen. 

2.2.1 Steuer- und Synchonisations Trigger 
Neben dem Ergebnis kann jede Zelle eine Menge an Trigger- 
Signalen erzeugen. Die Trigger-Signale mUssen nicht 
notwendigerWeise an die gleiche Zielzelle Ubertragen werden, 
wie das Ergebnis der Verarbeitung des konf igurierten Befehles. 
Ein Trigger-Signal oder erst die Kombination mehrerer Trigger- 
Signale, l6At bei der Zielzelle eine bestimmte Aktion aus Oder 
setzt die Zelle in einen bestimmten Zustand. Eine Beschreibung 



4 



WO 9835299 



PCI7DE98/00334 



der Zustande ist weiter unten im Text zu finden. Folgende 
Trigger-Signale gibt es: 

- GO-Trigger. Der GO-Trigger setzt die Zielzelle in den Zustand 
READY. 

- RECONFIG-Trigger. Der RECONFIG-Trigger setzt die Zielzelle in 
den Zustand RECONFIG, so daB die Zelle umprogrammiert werden 
kann. Besonders in Zusammenarbeit mit Switching-Tabellen ist 
dieser Trigger sehr sinnvoll. Geht man davon aus, dafi zu 
verarbeitenden Daten mit der steigenden Taktflanke in die 
Operanden-Register geladen werden, in der Zeitspanne des H- 
Level verarbeitet werden und mit der fallenden Flanke in das 
Ausgangsregister geschrieben werden, so ist eine 

Rekonf igurierung der Zelle mit der fallenden Flanke ra$glich. 
Mit der fallenden Flanke werden die neuen 

Konf igurationsdaten in das Bef ehls-Register geschrieben. Die 
Zeitspanne des L-Level ist ausreichend genug, um die 
Rekonf igurierung erfolgreich abzuschliefcen. 

- STEP-Trigger . Der STEP-Trigger I6£t bei der Zielzelle, welche 
sich im Zustand WAIT befindet, die einmalige Ausftihrung des 
konf igurierten Befehls aus. 

- STOP-Trigger . Der STOP-Trigger halt die Zielzelle an, in dem 
die Zelle in den Zustand STOP gesetzt wird. 

Durch die Moglichkeit in der verarbeitenden Zelle anzugeben, in 
welches Register der Zielzelle das Ergebnis eingetragen werden 
sell und welche Art von Trigger-Signal erzeugt werden soil, 
kann aus einem Datenstrom eine Menge an Verwaltungsdaten 
erzeugt werden. Diese Verwaltungsdaten stellen kein Ergebnis 



5 



WO 98/35299 



PCI7DE98/00334 



der eigent lichen Aufgabe dar, welche durch den Chip 
abgearbeitet werden soil, sondern dienen allein der Verwaltung, 
Synchronistion, Optimierung etc. des internen Zustands. 1 

Jede Zelle kann folgende Zustande annehmen, welche durch eine 
geeignete Kodierung iia Status-Register dargestellt werden. 

- READY. Die Zelle ist mit einem gtiltigen Befehl konfiguriert 
worden und kann Daten verarbeiten. Die Verarbeitung findet 
mit jedem Taktzyklus statt. Die Daten werden auf Grund der 
Adressierungsart der datenschickenden Zelle in die Register 
der Zielzelle eingelesen. 

- WAIT. Die Zelle ist mit einem gUltigen Befehl konfiguriert 
worden und kann Daten verarbeiten. Die Verarbeitung findet 
mit auf Grund eines Trigger-Signals statt, welches durch 
andere Elemente des Bausteins erzeugt werden konnen. Die 
Daten werden auf Grund der Adressierungsart der 
datenschickenden Zelle in die Register der Zielzelle 
eingelesen. 

- CONFIG. Die Zelle ist nicht mit einem gUltigen Befehl 

konfiguriert. Das Datenpaket > welches mit dem nSchsten 
Taktzyklus an die Zelle gesandt wird, wird in das Befehls- 
Register eingelesen. Das Datenpaket wird auf jeden Fall in 
das Befehls-Register eingelesen, egal welche 
Adressierungsart von der datenschickenden Zelle benutzt 
wurde . 

-CONFIG-WAIT. Die Zelle ist nicht mit einem gUltigen Befehl 
konfiguriert. Ein Datenpaket, wird mit dem nachsten Trigger- 
Signal, welches durch andere Elemente des Bausteins erzeugt 
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v/erden kann, eingelesen und in das Bef ehls-Register 
geschrieben. Das Datenpaket wird auf jeden Fall in das 
Bef ehls-Register eingelesen/ egal welche Adressierungsart 
von der datenschickenden Zelle benutzt wurde. 

- RECONFIG. Die Zelle ist mit einem gttltigen Befehl 

konf iguriert/ verarbeitet aber keine weiteren Daten, nimmt 
die Daten auch nicht an* Die Zelle kann durch ein anderes 
Element des Bausteins umkonf iguriert werden. 

- STOP. Die Zelle ist mit einem gtiltigen Befehl konf iguriert, 
verarbeitet aber momentan keine Daten. Die Daten werden von 
der Zelle angenommen (in die Eingangsregister ubertragen) , 
aber nicht weiterverarbeitet . 

Durch diese verschiedenen Zustande und der M6glichkeit auf die 
verschiedene Register einer Zelle schreibend und lesend 
zuzugreifen, kann jede Zelle eine aktive Yerwaltungsrolle 
einnehmen. Im Gegensatz dazu besitzen alle existierenden 
Bausteine dieser Art eine zentrale Verwaltungsinstanz, welche 
immer den gesamten Zustand des Bausteins kennen und handhaben 
muft . 

Urn eine weitere Flexibilit&t zu erreichen gibt es eine weitere 
Klasse an Befehlen, die nach der ersten AusfUhrung ihre Art 
wechseln. Bezogen auf des Beispiel des ADD-Befehls sieht ein 
Befehl dann so ausr 

- ADD-C-A. Das Ergebnis der ADD Funktion wird bei der ersten 
AusfUhrung des Befehls in das Bef ehls-Register der Zielzelle 
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geschrieben. Bei jeder weiteren Ausftthrung wird das Ergebnis 
in das Operand-Register-A geschrieben. 

Diese M5glichkeit kann beliebig erweitert werden, so dafi auch 

Befehle der Art ADD-C-V-A-C- -B denkbar sind. Jeder Befehl 

kann alle permutierten Kombinationen der verschiedenen 
Adressierungs- und Trigger-Arten annehmen. 

2.2.2 Rekonfigurationssteuerung mittels RECONFIG-Trigger: 

Im bisherigen Verfahren war es notwendig, da£ jedes zu 

konfigurierendes Element von einer externen Instanz einen 

RECONFIG-Trigger erhalten rauBte, urn in den Zustand 

■ rekonf igurierbar 1 Uberzugehen. Dies hat den Nachteil, dafi ftlr 

die Verteilung des RECONFIG-Triggers ein erheblicher 

Vernetzungsaufwand und Konf igurationsaufwand erforderlich war. 

Durch die Strukutur der Vernetzung, kann dieser Nachteil 
beseitigt werden. Alle konf igurierbaren Elemente, welche durch 
die Vernetzungsinformation zusammenhangen, stellen einen 
gerichteten Graphen dar. Ein solcher Graph kann mehrere Wurzeln 
(Quellen) und mehrere 3iatter (Ziele) haben. Die 
konf igurierbaren Elemente werden so erweitert , daii sie einen 
eingehenden RECONFIG-Trigger entweder in Richtung ihrer 
ausgehenden Register, eingehenden Register, oder einer 
Kombinataion derer, propagieren. Durch diese Propagierung 
erhalten alle direkt mit dem konf igurierbaren Element 
verbundenen konf igurierbaren Elemente ebenfalls den RECONFIG- 
Trigger. 
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Eine Konf iguration (Graph) kann nun komplett in den Zustand 
f rekonfigurierbar ' gebracht werden, in dem entweder an alle 
Wurzeln ein RECONFIG-Trigger geschickt wird und diese den 
RECONFIG-Trigger in Richtung der Ausgangsregister propagieren- 
Die Menge der Wurzeln in einem Graph, an die ein RECONFIG- 
Trigger geschickt werden mull, ist erheblich kleiner, als die 
Menger aller Knoten des Graphen. Dadurch wird eine erhebliche 
Minimierung des Aufwandes erreicht. Selbstverstandlich kann ein 
RECONFIG-Trigger auch an alle Blatter geschickt werden. Der 
RECONFIG-Trigger wird in diesem Fall in Richtung der 
Eingangsregister propagiert. 

Durch den Einsatz beider Moglichkeiten Oder einer Mischung 
beider Verfahren, kann die minimale Menge an konf igurierbaren 
Elementen berechnet werden, an die ein RECONFIG-Trigger 
herangefuhrt werden mufi. 

Die konf igurierbaren Elemente kSnnen einen Zusatz zu ihrem 
Status-Register bekoiamen, der angibt, ob ein eingehender 
RECONFIG-Trigger propagiert werden soil Oder nicht. Diese 
Information wird dann ben5tigt, wenn zwei Oder mehr 
verschiedene Graphen an ein Oder mehreren Stellen zusammen 
hangen (also einen Obergang haben) und es nicht gewunscht ist, 
daB auch einer der anderen Graphen in den Zustand 
'rekonfigurierbar' ilbergeht. Ein oder mehrere konf igurierbare 
Elemente verhalten sich also wie eine Schleuse. 
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Weiterhin kann das Status-Register derart erweitert werden, daJi 
ein zusatzlicher Eintrag angibt, in welche Richtung ein 
eingehender RECONFIG-Trigger weitergegeben werden soli. 

Das beschriebene Verfahren, kann auf alle Arten von Triggern 
und/oder Daten angewandt werden. Es kann dadurch eine 
automat ische 

Verteilungshierarchie hergestellt werden, welche sehr wenige 
Zugrif f sm5glichkeiten von aufien bendtigt, urn diese in Gang zu 
setzen. 

3. Implementierung mehrer Funktionen gleichzeitig in denselben 
konf igurierbaren Elementen 

3.1 Grundfunktion und ben6tigte Trigger 

Eine besonders komplexe Variante des Aufrufes verschiedener 
Macros durch eine Bedingung wird im Folgeriden vorgestellt: 
Bei der Ausfilhrung einer Bedingung (IF COMP THEN A ELSE B; 
wcbei COMP ein Vergleich darstellt, A und B auszuftthrende 
Operationen sind) werden keine GO- und STOP-Trigger generiert. 
Statt dessen wird ein Triggervektor (TRIGV) generiert, der 
angibt, zu welchem Ergebnis der Vergleich COMP gefiihrt hat. Der 
Triggervektor kann daher die Zustande "gleich", "groBer" oder 
"kleiner" annehmen. 

Der Vektor wird an eine nachfolgende Zelle gesandt, die anhand 
des Zustandes des Vektors genau ein bestimmtes 
Konf igurationsregister (entsprechend A oder B) aus einer 
Mehrzahl von Konf igurationsregistern auswahlt. Dadurch wird 
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erreicht, dafi je nach Ergebnis des vorangegangenen Vergleiches 
eine andere Funktion liber die Daten durchgefiihrt wird. 
ZustSnde wie "grSfier-gleich", "kleiner-gleich", "gleich- 
ungleich" werden aufgeiast, indent zwei Konf igurationsregister 
mit denselben Konf igurationsdaten beschrieben werden. 
Beispielsweise wird bei "groBer-gleich" das 

Konf igurationsregister "groiier" und das Konf igurationsregister 
"gleich" mit demselben Konf igurationswort beschrieben, wahrend 
das Konf igurationsregister "kleiner" ein anderes 
Konf igurationswort enthait. 

Bei der Implement ierung der Triggervektoren (TRIGV) ist keine 
Begrenzung auf die Zustande "groiier", "kleiner" und "gleich" 
erforderlich. Zur Auswertung von grofien "CASE ... OF" 
Konstrukten kann eine beliebige Zahl n, die den Zustand des 
CASE reprasentiert, als Triggervektor (TRIGV-m) zu der Oder den 
nachfolgen Zellen weitergeleitet werden. Mit anderen Worten 
gibt n den Vergleich innerhalb des CASE an, der bei Auswertung 
der anliegenden Daten zugetroffen hat. Zur Ausftihrung der 
innerhalb des CASE dem Vergleich zugeordneten Funktion wird n 
an die ausftihrenden Zellen weitergeleitet urn die entsprechende 
Funktion zu selektieren. wahrend die Zellen im 
"grc36er/kleiner/gleich"-Fall mindestens 3 

Konf igurationsregister ben5tigen, mufi bei der Verwendung von 
TRIGV-m die Anzahl der Konf igurationsregister mindestens genau 
dem maximalen Wert von n (max (n) ) entsprechen. 

3.2 Propagieren der ben5tigten Funktion durch Trigger 
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TRIGV/TRIGV-m werden an die erste, die Daten verarbeitende 
Zelle gesendet. In dieser Zelle werden TRIGV/TRIGV-M 
ausgewertet und die Daten entsprechend verarbeitet. Zusammen 
mit den Daten wird TRIGV/TRIGV-m an die nachfolgenden Zellen 
weitergeleitet (propagiert) ♦ Dabei erfolgt eine Weiterleitung 
an alle Zellen, die aufgrund der Auswertung (IF oder CASE) eine 
bestimmte Funktion ausfiihren. Dabei ist die Weiterleitung . 
direkt an die Weiterleitung der Datenpakete gekoppelt, d.h die 
Weiterleitung erfolgt synchron zu den Daten. Die zum Zeitpunkt 
t generierten TRIGV/TRIGV-m/ werden mit den zum Zeitpunkt t an 
den ersten verarbeitenden Zellen (CELLS1, vgl. Fig. 5: 0502, 
0505, 0507) anstehenden Daten verkniipft. TRIG/TRIG-V werden so 
weitergeleitet, dafi die Vektoren mit den Daten zum Zeitpunkt 
t+1 an den zweiten verarbeitenden Zellen anliegen und zum 
Zeitpunkt t+2 an den dritten verarbeitenden Zellen usw. bis zun 
Zeitpunkt t+m TRIG/TRIG-V und die Daten an den (m-l)-ten Zellen 
und gleichzeitig letzten Zellen, die von dem TRIG/TRIG-V 
auslosendem Vergleich (IF/CASE) abhangig sind, anstehen. Eine 
VerknUpfung erfolgt keinesfalls so, daB die zum Zeitpunkt t 
generierten TRIG/TRIG-V mit Daten verkntipft werden, die zu 
einem Zeitpunkt t 0 i d <t an CELLS1 anlagen! 

3.3 Reagieren auf das Auftreten oder Nicht-Auf treten von 
Triggern 

Es ist in Sonderfallen erforderlich auf das Nicht-Vorhandensein 
eines Triggers zu reagieren, d.h. ein Triggerzustand tritt auf, 
jedoch wird keine Anderung des Triggervektors ausgelost. Auch 
in diesem Fall kann eine sinnvolle und wichtige Information an 
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die nachfolgenden Zellen tibertragen werden. Beispielsweise ist 

bei einem Vergleich auf "grofler", "kleiner", "gleich" das 

Triggersignal "gleich" nicht vorhanden und andert sich auch 

nicht, wenn vom Zustand "kleiner" zum Zustand "groBer" 

tibergegangen wird. Dennoch beinhaltet das Nicht-Vorhandensein 

von "gleich" eine Information, namlich "ungleich". 

Urn auf beide Zust&nde "vorhanden" und "nicht vorhanden" 

reagieren zu konnen, wird ein Eintrag in das 

Konf igurationsregister der Zelle hinzugeftigt, das angibt/ auf 

welchen der Zust&nde reagiert werden soil. 

Zudem wird zum Triggervektor TRIGV, der die Zustande "gleich", 
"grBBer" und "kleiner" reprasentiert, ein Signal TRIGRDY 
hinzugeftigt, der das Auftreten eines Triggers anzeigt. Dies is 
notwendig, da der Zustand "nicht vorhanden" auf einem der 
Vektoren keinen Aufschlufi mehr liber das Vorhandensein eines 
Trigger an sich gibt. 

TRIGRDY kann fUr ein Handshaking-Protokoll zwischen der 
sendenen und empfangenden Zelle benutzt werden, indem die 
empfangende Zelle einen TRIGACK generiert, sobald sie die 
Triggervektoren ausgewertet hat. Erst nach Eintreffen des 
TRIGACK nimmt die sendende Zelle den Triggerzustand zuriick. 
Dabei wird anhand eines Eintrages in das 

Konf igurationsregisters festgelegt, ob bei Aussenden eines 
Triggervektors auf den Erhalt eines TRIGACK gewartet werden 
soil, oder ob der Trigger kanal unsynchronisiert ablauft. 

3.4 Einsatz in Mikroprozessoren 
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In Mikroprozessoren neuester Architektur werden bedingte 
Sprtinge nicht mehr nach dem bekannten Verfahren der Branch- 
Prediction, also der Vorhersage eines Sprunges ausgeftihrt. Die 
spekulative Vorhersage von Sprilngen, die zur 
Leistungssteigerung von Prozessoren eingeftihrt wurde, 
berechnete Sprtinge aufgrund von spekulativen Algorithmen voraus 
und muBte bei fehlerhaften Berechnungen die gesamte 
Prozessorpipeline neu laden, was zu erheblichen 
Leistungsverlusten ftihrte. 

Urn diese Verluste zu eleminieren wurde das neue Predicate/NOP- 
Verfahren eingeftihrt. Dabei ist jedem Befehl ein ein Bit 
breites Status-Flag zugeordnet, das anzeigt, ob der Befehl 
ausgeftihrt werden soil - Oder nicht. Dabei kann eine beliebige 
Menge an Statusflags exist ieren. Die Zuordnung von Befehlen zu 
Status-Flags geschieht durch einen Compiler wahrend der 
Ubersetzung des Codes. Die Status-Flags werden von den ihnen 
zugeordneten Vergleichsoperationen zur Ausftihrungzeit verwalte~ 
und zeigen das Ergebnis des jeweiligen Vergleiches an. 
Je nach Zustand des einem Befehl zugeordneten Status-Flag wir 
der Befehl dann vom Prozessor ausgeftihrt (sofern das Status- 
Flag "ausfiihren" anzeigt) oder der Befehl wird nicht ausgefuhrt 
und durch einen NOP ersetzt (sofern das Status-Flag "nicht 
ausftihren" anzeigt). Ein NOP steht ftir "No operation", was 
bedeutet, dafi der Prozessor in diesem Zyklus keine Operation 
ausftihrt. Dadurch geht der Zyklus ftir sinnvolle Operationen 
verloren. 

Zur Optimierung des Zyklusverlustes werden zwei Moglichkeiten 
vcrgeschlagen: 
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3.5.1 Mehrere Bef ehlsregister pro Recheneinheit 
Eine moderner Mikroprozessor besitzt mehrere relativ 
unabhangige Rechenwerke . 

GemaB dem hier vorgestellten Trigger-Prinzip kdnnen die 
einzelnen Recheneinheiten mit mehreren Bef ehlsregistern 
ausgestattet werden, wobei ein Befehlsregister eines 
Mikroprozessorrechenwerkes synonym flir ein 

Kcnf igurationsregister gemafi P19651075.9 steht. Die Auswahl des 
jeweilig aktiven Bef ehlsregisters erfolgt 

a) anhand von Triggervektoren, die anderen Rechenwerken anhand 
von Vergleichen generiert wurden. 

b) anhand von mehrbittigen Status-Flags (im folgenden Status- 
Vektoren genannt) , die gemaii dem heutigen Verfahren nach dem 
Stand der Technik, Vergleichsbefehlen zugeordnet sind. 

3.5.2 Geanderter VLIW-3ef ehlssatz 

Eine besondere Ausgestaltung bietet sich durch VLIW- 
Befehlssatze. So kann innerhalb eines Befehlswortes mehrere 
mCglichen, von einem Vergleich abhangenden, Befehle zu einem 
Befehl zusammengefaBt werden. Ein VLIW-Wort beliebiger Breite 
wird in eine beliebige Menge an Befehlen (Codes) unterteilt. 
Jeder einzelne dieser Codes wird durch einen Triggervektor oder 
Status-Vektor referenziert. Das bedeutet, zur Laufzeit wird 
einer der vorhandenen Codes aus dem VLIW-Wort ausgewahlt und 
verarbeitet. 
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In der Tabelle ist ein mogliches VLIW-Wort mit vier Codes 
abgebildet, auf das ein 2-bittiger Triggervektor oder ein 2- 
bittiges Statusflag ref erenziert : 



VLIW- 
Befehls- 
wort : 


CodeO 


Codel 


Code2 


Code3 


Zuordnung : 










Trigger- 
vektor / 
Status-Flag 


00 


01 


10 


11 



4. Erweiterung der Hardware gegentiber PI 9651 07 5. 9 

4.1 Zusatzliche Register 

Zu den in P19651075.9 beschriebenen Register koinmt ein 
Statusregister und ein Konf igurationsregister hinzu. Beide 
Register werden vom PLU-Bus angesteuert und haben Verbindung 
zur Zustandsmaschine der SM-UNIT (P19651075.9 Fig. 2 0213). 

4.2 Veranderung des PLU-Busses 

In P19651075.9 werden die konf igurierbaren Register M-/F-PLUREG 
ausschliefclich iiber den PLU-Bus (P19651075.9 Fig. 2 0210) 
verwaltet. Um die erf indungsgemafle Funktion zu gewahrleisten 
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muB nunmehr eine zusatzliche Zugrif f smoglichkeit durch den 
ncrmalen Systembus (P19651075.9 Fig. 2 0201) mdglich sein. 
Dasselbe gilt ftir die neuen Status- und Konf igurationsregister . 
Dabei ist nur der Teil des Systembusses ftir die Register 
relevant, der Uber die BM-UNIT (P19651075.9 Fig. 2 0210) mit 
der PAE vernetzt ist. 

Daher wird der Bus von der BM-UNIT an die Register 
weitergeleitet, wo vorgeschaltete Multiplexer oder 
vorgeschaltete Tore die Uraschaltung zwischen dem PLU-Bus und 
dem ftir die PAE relevanten Systembus tibernehmen. 
Dabei sind die Multiplexer oder Tore so geschaltet/ dafi sie 
immer den ftir die PAE relevanten Systembus durchschalten, aufier 
nach einem Rticksetzen des Bausteines (RESET) oder wenn das 
ReConfig-Signal (P19651075.9 Fig. 3 0306) aktiv ist. 

4.3 Erweiterungen der konf igurierbaren Elemente (PAEs) gem. 
P19651075.9 

4.3.1 Triggerquellen 

Ein konf igurierbares Element kann Trigger von mehreren Quellen 
gleichzeitig empfangen. Durch diese M6glichkeit kann mit Hilfe 
von Maskierungs-Registern eine flexiblere Semantik der Trigger 
erreicht werden. 

4.3.2 Mehrere Konf igurationsregister 

Anstatt eines Konf igurationsregisters besitzt eine PAE mehrere 
(max (n) ) Konf igurationsregister . 

4.3.3 Konf igurationsstatemachine und Multiplexer 
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Den Konf igurationsregistern nachgeschaltet ist ein Multiplexer 
der eine der moglichen Konf igurationen auswahlt. Die Steuefung 
des Multiplexers erfolgt durch eine separate oder in die PAE- 
Statemachine integriert Statemachine, die den Multiplexer 
anhand eingehender Triggervektoren steuert. 

4.3.4 Triggerauswertung und Konf iguration 

Ein konf igurierbares Element kann ein Maskierungs-Register 
enthalten, in dem eingestellt werden kann, auf welchen Trigger 
Eing&ngen, ein 

Trigger-Signal anliegen mu&, so dafi die Bedingungen ftir eine 
Aktion des konf igurierbaren Elements, erfullt sind. Ein 
kcnfigurierbares Element reagiert nicht nur auf einen Trigger, 
scndern auf eine eingestellte Kombination aus Triggern. 
Weiterhin kann ein konf igurierbares Element eine Priorisierung 
gleichzeitig eingehender Trigger vornehmen. 

Eingehende Trigger werden anhand des TR I GRDY- Signals erkannt. 
Dabei werden die Triggervektoren gem^B zusatzlich in den 
Konfigurationsregistem vorhandenen Konf igurationsdaten 
ausgewertet . 

4.3.5 Triggerhandshake 

Sobald die Triggervektoren ausgewertet sind, wird ein TRIGACK 
zur Bestatigung des Triggervektors generiert. 

4.3.6 BM-UNIT 

Die BM-Unit wird so erweitert, dafi sie vom Bus kommende Trigge 
gema6 der Konf iguration im M-PLUREG an die Sync-Unit und SM- 
Unit weiterreicht. Von der EALU generierte Trigger (z.B. 
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Vergleicherwerte "grefcer", "kleiner", "gleich", O-Detektoren, 

Vorzeichen, Ubertrage, Fehlerzustande (Division durch 0, etc.), 

etc*) werden gem^B der Verschaltungsinformation im M-PLUREG von 
der BM-UNIT an den Bus weitergeleitet . 



19 



WO 98/35299 



PCT7DE98/00334 



4.4 Erweiterungen des Systembusses 

Der Systembus (P19651075.9 Fig. 2 0201) wird dahingehend 
erweitert, daS zusammen mit den Daten die Informationen tiber 
die Zielregister tibertragen werden. Das bedeutet, eine Adresse 
wird mitgeschickt, die beim Datenemf&nger das gewttnschte 
Register selektiert. 

Ebenfalls wird der Systembus um die unabhangige Obertragung von 
Triggervektoren und -handshakes erweitert. 

5. Kurzbeschreibung der Diagramme 

Fig. 1 zeigt, wie durch den Einsatz von Triggern ein 

Schleifenkonstrukt implement iert werden kann. 

Fig. 2 zeigt, wie durch den Einsatz mehrerer Trigger ein 

Vergleichskonstrukt implementiert werden kann. 
Fig. 3 zeigt, wie durch den Einsatz mehrerer Trigger und deren 

Verschachtelung ein Vergleichskonstrukt mit mehreren 

Ausgangen implementiert werden kann. 
Fig. 4 zeigt die notwendigen Erweiterungen gegentiber 
P19651075.9. 

Fig. 5 zeigt in einem Funktionsbeispiel die Auswahl 

verschiedener Funktionen der konf igurierbaren Elemente 
durch Trigger. 

Fig. 6 zeigt die Implementierung von mehreren durch Trigger 
angesteuerten Konfigurationsregistern zur Ausfiihrung 
verschiedener Funktionen. 

Fig. 7 zeigt die Implementierung des Verfahrens aus Fig. 6 in 
Mikroprozessoren 
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6. Detailbeschreibung der Diagramme und AusfUhrungsbeispiele 
Figur 1 

Das Makro 0103 soil in diesem Beispiel 70 mal ausgefiihrt 
werden. Eine Ausftihrung des Makros benfttigt 26 Taktzyklen. Das 
bedeutet, daB nur alle 26 Taktzyklen der Z&hler 0101 um eins 
veringert werden darf . Ein Problem bei frei programmierbaren 
Bausteinen ist nun, dafl nicht immer garantiert werden kann, dafi 
auch wirklich nach 26 Takten die Abarbeitung des Makros 0103 
abgeschlossen ist. Eine Verzogerung kann zum Beispiel dadurch 
entstehen, daB ein Makro, welches die Eingangsdaten ftir Makro 
0103 lief era soil, plotzlich 10 Taktzyklen langer benotigt. Aus 
diesem Grund sendet die Zelle in Makro 0103 ein Trigger Signal 
an den Zahler 0101, durch welche das Ergebnis der Berechnung an 
ein weiteres Makro gesandt wird. Gleichzeitig wird die 
Verarbeitung des Makros 0103 durch die gleiche Zelle gestoppt. 
Diese Zelle T weis T genau, daB die Bedingung fUr die Beendigung 
einer Berechnung erreicht wurde. 

Das gesendete Trigger-Signal ist in diesem Fall ein STEP- 
Trigger, welcher veranlaBt, daB der zahler 0101 einmal seine 
konf igurierte Funktion ausfiihrt. Der Zahler zahlt seinen 
ZShlerwert um eine herunter und vergleicht, ob er den Wert 0 
erreicht hat. Ist dies nicht der Fall, wird ein GO-Trigger an 
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das Makro 0103 abgeschickt. Dieses GO-Trigger-Signal veranlafct 
das Makro 0103 seine Funktion wieder aufzunehmen. 

Dieser Vorgang wiederholt sich solange, bis der Zahler 0101 den 
Wert 0 erreicht hat. In diesem Fall wird ein Trigger-Signal an 
das Makro 0102 geschickt und 16Bt dort eine Funktion aus. 
Durch dieses Zusammenspiel von Triggern kann eine sehr 
f eingranulare Synchronisation err eicht werden. 

Figur 2 

Figur 2 entspricht der Grundidee her Figur 1. Die Funktion in 
Element 0202 ist diesesmal jedoch kein Zahler sondern ein 
Vergleicher. Das Makro 0201 schickt nach jedem 
Verarbeitungsdurchlauf einen Verleichswert mit an den 
Vergleicher 0202. Je nach Ausgang des Vergleichs, werden 
wiederum verschiedene Trigger angesteuert um zum Beispiel eine 
Aktion in den Makros 0203 zu veranlassen. Das in Figur 2 
implementierte Konstrukt entspricht dem einer IF-Abfrage in 
einer Progammiersprache . 

Figur 3 

Wie in Figur 2 werden hier mehrere Vergleicher 0301, 0302 
eingesetzt, um die Konstruktion eines IF-ELSE-ELSE Konstruktes 
(oder einer Mehrf achauswahl) zu implement ieren. Durch die 
Verwendung verschiedentster Arten von Triggern und Verbindungen 
dieser Trigger zu den Makros 0303, 0304 ktfnnen sehr komplexe 
Ablaufe einfach implementiert werden. 
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Figur 4 

zeigt die Unterschiede zu P19651075.9 Fig. 2. Das hinzugefUgte 
Konf igurationsregister (0401) und das hinzugefUgte 
Statusregister (0402) haben ttber den Bus (0407) Verbindung zur 
SM-UNIT. Die Register 0401, 0402, F- und M-PLUREG sind Uber 
einen internen Bus 0206 mit einem Tor 0403 verbunden. Dieses 
verbindet den internen Bus (0406) je nach Stellung mit dem PLU- 
Bus 0405 um eine Konf iguration durch die PLU zu ermoglichen 
Oder tiber einen Bus 0408 mit dem BM-UNIT. Diese schaltet je 
nach Adressierung auf dem Datenbus 0404 die Daten zu den O-REG 
weiter oder zu dem adressierten Register 0401, 0402, F- Oder M- 
PLUREG. 

Die BM-UNIT (0411) sendet Uber 0415 Triggersignale an die SYNC- 
UNIT (0412) . Von der EALU erhait 0411 Uber 0414 Ergebnisse 
("gleich", "grofler", "kleiner", "Ergebnis = 0", "Ergebnis 
positiv", "Ergebnis negativ", Oberlauf (positiv und negativ) , 
etc.) um diese in Triggervektoren umzuwandeln. Alternativ 
koiinen von der SYNC-UNIT oder STATE -MACHINE generierte Zustande 
Uber 0415 an die BM-UNIT Ubermittelt werden. 
Die von der BM-UNIT an den Bus (0404) Ubertragenen 
Triggersignale konnen je nach Konf iguration der auswertenden 
konfigurierbaren Elemente dort als STEP/STOP/GO-, RECONFIG- 
Trigger oder zur Auswahl eines Konf igurationsregisters 
verwendet werden* Welche Funktion ein generierter Trigger bei 
den auswertenden konfigurierbaren Elementen erfUllt, wird durch 
die Vernetzung (0404). und die Konf iguration der jeweiligen 
konfigurierbaren Elemente bestimmt. Ein und derselbe Trigger 
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kann bei verschiedenen konf igurierbaren Elementen 
unterschiedliche Funktion haben. 

0416 ist der Ergebnisausgang von R-REGsft zura Bussystem 04 04 
und den nachfolgenden konf igurierbaren Elementen. 

Figur 5 

In Figur 5 ist das zeitliche Verhalten zwischen generierten 
Triggern und den durch die Trigger selektierten 
Konf igurationsregistern beispielsweise aufgezeigt. 0501 
generiert durch einen Vergleich den Triggervektor TRIGV, der 
die Werte "equal" (gleich), "greater" (gr5Ber) oder "less" 
(kleiner) annehmen kann* Die konf igurierbaren Elemente 0502- 

0504 verarbeiten Daten abhangig vom Vergleich (0501) . Dabei ist 
die Verarbeitung von den Vergleichswerten "equal" , "greater" 
und "less" abhangig. Die Verarbeitung ist gepipelinet, das 
heifit, ein Datenwort wird nacheinander von 0502, dann von 0503 
und zuletzt von 0504 modif iziert . 

0505 verarbeitet ebenfalls Daten in Abhangigkeit von 0501* 
Dabei beschrankt sich die Abhangigkeit allerdings auf die 
Vergleichswerte "less", "greater" UND "equal" bewirken die 
gleiche FunktionsausfUhrung. Es werden also die Werte "kleiner" 
und "grower oder gleich" unterschieden. 0506 ist in der 
Pipeline 0505 nachgeschaltet . Dabei reagiert 0506 auf "equal -\ 
"greater" und "less" unterschiedlich (vgl. 0503) . 

0507 ist ebenfalls von 0501 abhangig, jedoch werden die Werte 
"gleich" und "ungleich (kleiner oder groiier) " unterschieden. 
Das AusfUhrungsbeispiel beginnt bei dem Zeitpunkt t (Fig. 5a) 
und endet am Zeitpunkt (t+3) . Durchiaufen Daten eine der 
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Pipelines (0502, 0503, 0504 bzw. 0505, 0606) werden sie bei 
jeder Ausfuhrung in einer der Makros (0502-0506) urn einen 
Taktzyklus verzSgert. LSngere und ins besondere 
unterschiedliche Verzogerungen ktfnnen ebenfalls auftreten. Da 
zwischen den Daten und Triggersignalen ein Handshakemechanismus 
zur automat ischen Synchronisation (vgl. P19651075.9 (Daten), 
bzw. diese Schrift (TRIGACK/TRIGRDY) ) besteht, muB auf diesen 
Fall nicht gesondert eingegangen werden. 

Durch die Verz5gerungen stehen zum Zeitpunkt t beispielsweise 
zwischen der zweiten und dritten Pipelinestuf e die Daten und 
Triggersignale des frttheren Zeitpunktes t-2 an. 
Von Fig. 5a bis Fig 5d ist der Ablauf von 3 Taktzyklen (t bis 
t+2) dargestellt. 
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Die von 0501 generierten Triggervektoren (also die 
Vergleichsergebnisse) sehen Uber t betrachtet wie folgt aus: 



Zeit t 


Vergleichsergebnis 


t-2 


less, kleiner 


t-1 


greater, grflfier 


t 


equal, gleich 


t+1 


greater, gr6fcer 


t+2 


equal, gleich 



In Figur 6 ist die Integration mehrerer Konf igurationsregister 
in ein konf igurierbares Element dargestellt. In diesem 
Ausfilhrungsbeispiel existieren drei Konf igurationsregister 
(0409) nach Fig, 4. Diese werden Uber den Bus 0406 
konfiguriert. Ober das Bussystem 0411 erhait eine Steuereinheit 
(C601) (die auch als Statemachine ausgestaltet werden kann) die 
Signale TRIGV und TRIGRDY. Die Steuereinheit schaltet gemafi 
TRIGV eines der Konf igurationsregister liber den Multiplexer 
(C602) auf das Bussystem 0410, das zu den Steuermechanismen des 
konf igurierbaren Elementes ftlhrt. Zur Synchronisation der 
Triggersignale mit den internen Abiaufen des konf igurierbaren 
Elementes besitzt 0601 einen Synchronisationsausgang, der an 
die Synchronisationseinheit (0412) oder die Statemachine (0413) 
ftlhrt. Zur Synchronisation der Triggerquellen generiert 0601 
das Handshakesignal TRIGACK nach Verarbeitung des eingegangenen 
Triggers. 

In dem AusfUhrungsbeispiel ist jedes der Konf igurationsregister 
(C409) einem TRIGV vom Typ ("equal", "greater", "less") 
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zugeordnet. Werden bei jedem der Trigger typen andere 
Operationen aiusgefuhrt, so ist jedes der Konf igurationsregister 
unterschiedlich belegt. Wird beispielsweise nur aus "equal" und 
"not equal" unterschieden, sind die Konf igurationsregister flir 
die Typen "less" und "greater" gleich belegt, namlich mit der 
Konf iguration fUr "not equal". Das Konf igurationsregister fUr 
"equal" besitzt eine andere Belegung. Das bedeutet, anhand der 
Belegung der Konf igurationsregister kann der Vergleich genauer 
spezifiziert werden, wobei jedes konf igurierbare Element diese 
Spezif izierung unterschiedlich gestal ten kann, 
t)ber das Register 0603 wird TRIGV zusammen mit dem Ergebnis an 
die nachfolgenden konf igurierbaren Elemente weitergeleitet urn 
ein Pipelining gem. Fig. 5a-d zu ermoglichen. Das Register und 
die Handshakesignale werden von 0412 Oder 0413 gesteuert. Die 
Trigger information kann zusammen mit dem Ergebnis aus dem R- 
REGsft oder zeitversetzt , also vor dem Ergebnis, tiber das 
Interface 0416 an die nachfolgenden konf igurierbaren Elemente 
tibertragen werden. 

Eine zeitversetzte Obertragung bietet den Vorteil, dafi keine 
zusatzliche Zeit zum Einstellen der Konf igurationsregister in 
den nachfolgenden konf igurierbaren Elementen erforderlich ist, 
da die Einstellung bereits vor Erhalt der Daten (zeitgleich mit 
dem Freigeben des Ergebnisses (vgl. P19651075. 9) ) erfolgt. Ein 
entsprechendes Timing (bezogen auf P19651075.9 Fig. 8) ist in 
Fig. 6a dargestellt. Die Triggervektoren (0615) werden mit der 
steigenden Flanke (0613) des Bausteintaktes (0614) generiert. 
Mit der fallenden Flanke (0612) werden die Trigger in den 
konf igurierbaren Elementen ausgewertet. Die Daten laufen 
phasenverschoben, d.h. sie werden bei 0612 freigegeben und mit 
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0613 eingelesen. W&hrend 0610 werden die Triggervektoren iiber 
den Bus Obertragen und die Daten berechnet. wahrend 0611 werden 
die Daten Uber den Bus ttbertragen und die Trigger berechnet, 
bzw. die Konf igurationsregister der konf igurierbaren Elemente 
gemotB den bei 0613 gespeicherten Daten ausgewahlt und die 
Konf iguration entsprechend eingestellt. 

Figur 7a zeigt die Verwaltung von Sprtingen nach dem 
Predicate/NOP-Verfahren gemaB dem Stand der Technik. Beim 
Ausftihren eines Vergleiches wird ein Eintrag im Predicate- 
Register (0704) gesetzt. Dieser Eintrag wird wahr end der 
Ausfiihrung von Befehlen abgefragt und legt fest, ob ein Befehl 
ausgefuhrt wird (der Befehl innerhalb der von dem bedingten 
Sprung angesprochenen Codesequenz liegt) , oder durch einen NOP 
ersetzt wird (der Befehl liegt in einer anderen als der durch 
den bedingten Sprung angesprochenen Codesequenz) . Der Befehl 
steht dabei in dem Bef ehlsregister 0701. Das Predicate-Register 
enth&lt eine Mehrzahl von Eintragen, die einer Mehrzahl von 
Operationen und/oder einer Mehrzahl von Rechenwerken zugeordhet 
sind. Diese Zuordnung wird zur Compile-Zeit des Programmes von 
Compiler vergeben. Die Zuordnungs information (0707) wird dem 
Befehl, der in das Bef ehlsregister eingetragen wird zugeordnet, 
so daB ein eindeutiger Eintrag durch den jeweiligen Befehl 
referenziert wird. 

Durch 0703 wird ausgewahlt ob der Befehl aus 0.701 oder ein NOP 
ausgefuhrt wird. Bei der Ausfiihrung eines NOPs geht ein 
Taktzyklus verloren. 0703 hat dabei symbolischen Charakter,. da 
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prinzipiell auch die Ausftihrungseinheit (0702) direkt von 0704 
angesteuert werden konrxte. 

In Figur 7b existieren n Bef ehlsregister (0701: Func 1 — Func 
n) . 

Bei der Ausfiihrung eines Vergleiches / bedingten Sprunges wird 
das zu adressierende Bef ehlsregister, also das Ergebnis des 
Vergleiches, als Eintrag (0708) in dem Predicate-Register 0706 
abgelegt, wobei 0706 aus einer Mehrzahl solcher Eintrage 
besteht. Der jeweilige Eintrag (0708) in 0706 ist dabei so 
breit, daB alle mSglichen Befehlsregister einer 
Ausftihrungseinheit (0702) durch ihn adressiert werden kbnnen/ 
das bedeutet, bei n Befehlsregistern ist die Eintragsbreite 
log 2 (n). Das Predicate-Register enthalt eine Mehrzahl von 
EintrSgen, die einer Mehrzahl von Operationen und/oder einer 
Mehrzahl von Rechenwerken zugeordnet sind. Diese Zuordnung wird 
zur Compile-Zeit des Programmes vom Compiler vergeben. Die 
Zuordnungsinformation (0707) wird der Menge an Befehlen, die in 
die Befehlsregister eingetragen wird zugeordnet, so dafi ein 
eindeutiger Eintrag durch die jeweilige Befehle referenziert 
wird. 

Ober den Multiplexer wird ausgewShlt, welches Befehlsregister 
den Code fiir die momentane Ausfiihrung liefert. 
Durch diese Technik wird bei bedingten Sprtingen auch im 
ungtinstigsten Fall anstatt eines NOPs ein gtiltiger Befehl 
ausgeflihrt/ wodurch kein Taktzyklus verschwendet wird. 
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Begrif f sdef inition 

BM-UNIT Einheit zum Aufschalten der Daten auf die Bussysteme 
auBerhalb der PAE. Das Aufschalten geschieht ttber Multiplexer 
fUr die Dateneingange und Tore fiir die DatenausgSnge, oACK- 
Leitungen sind als Open-Kollektor-Treiber implement iert. Die 
BM-UNIT wird durch das M-PLUREG gesteuert* 

Datenempfanger Die Einheit (en) , die Ergebnisse der PAE 

weiterverarbeitet/-arbeiten 

Datensender Die Einheit (en), die Daten ftlr die PAE als 
Operanden zur Verfugung stellt/stellen 

Datenwort Ein Datenwort besteht aus einer beliebig langen 

Bit-Reihe. Diese Bit-Reihe stellt eine Verarbeitungseinheit fUr 
eine Anlage dar. In einem Datenwort k5nnen sowohl Befehle far 
Prozessoren o.a. Bausteine sowie rein Daten kodiert werden. 

DFP Datenfluflprozessor nach Patent/Of fenlegung DE 44 16 

881 

DPGA Dynamisch konf igurierbare FPGAs . Stand der Technik 

EALU Erweiterte arithmetisch logische Einheit • ALU, die upi 

Sonderfunktionen, die zum Betrieb einer 

Datenverarbeitungseinrichtung gemaft DE 441 16 881 Al benotigt 
werden oder sinnvoll sind erweitert wurde. Dies sind ins 
besondere Zahler. 
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Elemente Sammelbegrif f fur alle Arten von in sich . 

abgeschlossenen Einheiten, welche als Stuck in einem 
elektronischen Baustein zum Einsatz kommen kCnnen. Elemente 
sind also: 

- Konfigurierbare Zellen aller Art 

- Cluster 

- RAM-B16cke 

- Logik 

- Rechenwerke 

- Register 

- Multiplexer 

- I/O Pins eines Chips 

Ereignis Ein Ereignis kann durch ein Hardwareelement in 

irgendeiner zur Anwendung passenden Art und Weise ausgewertet 
werden und als Reaktion auf diese Auswertung eine bedingte 
Aktion ausl5sen. Ereignisse sind somit zum Beispiel: 

- Taktzyklus einer Rechenanlage. 

- internes Oder externes Interrupt-Signal. 

- Trigger-Signal von anderen Elementen innerhalb des 
Bausteines. 

- Vergleich eines Datenstroms und/oder eines Bef ehlstroms mit 
einem Wert* 

- Input/Output Ereigenisse. 

- Ablaufen, tiberlaufen, neusetzen etc. eines Zahlers. 

- Auswerten eines Vergleichs. 

FPGA. Programmierbarer Logikbaustein. Stand der Technik. 
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F-PLUREG Register in dem die Funktion der PAE gesetzt wird. 
Ebenfalls wird der OneShot- und Sleep-Mode gesetzt. Das 
Register wird von der PLU beschrieben. } 

H-Pegel Logisch 1 Pegel, abhangig von der verwendeten 
Technologie 

Jconfigurierbares Element Ein konf igurierbares Element 

stellt eine Einheit eines Logik-Bausteines dar, welche durch 
ein Konfigurationswort fttr eine spezielle Funktion eingestellt 
werden kann. Konf igurierbare Elemente sind somit, alle Arten 
von RAM Zellen, Multiplexer, Arithmetische logische Einheiten, 
Register und alle Arten von interner und externer 
Vernetzungsbeschreibung etc.} 

konfigurierbare Zelle Siehe Logikzellen 

Konfigurieren Einstellen der Funktion und Vernetzung 

einer logischen Einheit, einer (FPGA) -Zelle oder einer PAE 
(vgl. umkonfigurieren) . 

Konf igurationsda ten Beliebige Menge von 

Konf igurationsworten . 

Konfigurationsspeicher Der Konf igurationspeicher enthait 

ein oder mehrere Konf igurationsworte. 

Konfigurationswort Ein Konfigurationswort besteht aus 

einer beliebig langen 3it-Reihe. Diese Bit-Reihe stellt eine 
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gttltige Einstellung fUr das zu konf igurierende Element dar, so 
das eine funktionsf ahige Einheit entsteht. 

Ladelogik Einheit zum Konf igurieren und Umkonf igurieren 

der PAE . Ausgestaltet durch einen speziell an seine Aufgabe 
angepafiten Mikrokontroller. 

Logikzellen Bei DFPs, FPGAs, DPGAs verwendete 
konfigurierbare Zellen, die einfache logische oder 
arithmetische Aufgaben gemaB ihrer Konf iguration erftillen. 

L-Pegel Logisch 0 Pegel, abhangig von der verwendeten 
Technologie 

M-PLUREG Register in dem die Vemetzung der PAE gesetzt wird. 
Das Register wird von der PLU beschrieben. 

O-REG Operandenregister zur Speicherung der Operanden der 
EALU. ErmtSglicht die zeitliche und funktionelle Unabh^ngigkeit 
der PAE von den Datensendern* Dadurch wird der Transfer der 
Daten vereinfacht, da er asynchron oder paketorientiert 
stattfinden kann. Gleichzeitig wird die M6glichkeit geschaffen 
die Datensender unabhangig von der PAE oder die PAE unabhangig 
von den Datensendern umzukonf igurieren. 

PLU Einheit zum Konf igurieren und Umkonf igurieren der 

PAE. Ausgestaltet durch einen speziell an seine Aufgabe 
angepafiten Mikrokontroller. 
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Propagieren Kontrolliertes Weiterleiten eines empfangenen 
Signales. 

RE CONFIG Rekonfigurierbarer Zustand einer PAE. 

RECONFIG-Trigger Setzen einer PAE in den rekonf igurierbaren 
Zustand. 

SM-UNIT StateMachine-UNIT. Zustandsmaschine, die die EALU 
steuert. 

Switching-Tabelle Eine Switching-Tabelle ist ein Ring- 
Speicher, welcher durch eine Steuerung angesprochen wird. Die 
EintrSge einer Switching-Tabelle konnen beliebige 
Konf igurationsworter aufnehmen. Die Steuerung kann Befehle 
durchftihren. Die Switching-Tabelle reagiert auf Triggersignale 
und konfiguriert konf igurierbare Elemente ahhand eines 
Eihtrages in einem Ringspeicher um. 

Synchronisationssignale Statussignale die von einem 

konfigurierbaren Element oder einem Rechenwerk generiert werden 
und zur Steuerung und Synchronisation der Datenverarbeitung an 
weitere konf igurierbare Element oder Rechenwerke weitergeleitet 
werden. Es ist auch m6glich ein Synchronisationssignal zeitlich 
verzbgert (gespeichert) an ein und dasselbe konf igurierbare 
Element oder Rechenwerk zurtickzuleiten. 

TRIGACK/TRIGRDY Handshake der Trigger. (Vgl. Handshake der 
Daten aus P19651075.9) 
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Trigger Synonym fur Synchronisationssignale. 

Umkonfigurieren Neues Konf igurieren von einer beliebigen 
Menge von PAEs wShrend eine beliebige Restmenge von PAEs ihre 
eigenen Funktionen fortsetzen (vgl. konf igurieren) . 

Verarbeitungszyklus Ein Verarbeitungszyklus beschreibt die 

Dauer, welche von einer Einheit bendtigt wird, um von einem 
def inierten und/oder gtiltigen Zustand in den nachsten 
definierten und/oder gtiltigen Zustand, zu gelangeh. 

VLIW Very Large Instruction Word. Kodierung von 

Mikroprozessoren, Verfahren nach dem Stand der Technik. 

Zellen Synonym ftir konf igurierbare Elemente 



37 



WO 98/35299 PCT/DE98/00334 



Patentanspruche 

1. Verfahren zur Synchronisation und Umkonf iguration von 
konf igurierbaren Elementen in Bausteinen mit zwei- oder 
mehrdimensionaler programmierbarer Zellstruktur (DFP, FPGA, 
DPGA, RAW-Machines) , 

sowie zur Steuerung bedingter Sprtinge in tiblichen 
Mikroprozessoren, Digitalen Signalprozessoren und 
Mi kr o kon t r o 1 1 e r n , 
dadurch gekennzeichnet, daB 

a) Synchronisationssignale wahrend der Verarbeitung 
innerhalb des Datenstromes von den verarbeitenden 
konfigurierbaren Elementen durch Vergleiche, 
Vorzeichen, UbertrSge von arithmetischen Operationen, 
Fehlerzustanden, u. dgl., generiert werden und an 
weitere Elemente zur Synchronisation Uber den Datenbus 
gesandt werden, 

b) aus dem Datenstrom heraus anhand entsprechender Befehie 
Konfigurationsworter innerhalb eines konfigurierbaren 
Elementes generiert werden und tiber den Datenbus 
zusammen mit der Adresse des anzusprechenden Registers 
an ein weiteres konf igurierbares Element ubertragen 
werden, wobei dieses dadurch ohne den EinfluB einer 
externen Ladelogik (urn) konf iguriert wird, 

c) zur Laufzeit anhand von Synchronisationssignalen eine 
gtiltige Konf iguration der konfigurierbaren Elemente aus 
einer Mehrzahl an Konf igurationen oder ein gUltiger 
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Befehl aus mehreren moglichen Befehles eines 
Rechenwerkes ausgewahlt wird. 
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2. Verfahren nach Anspruch 1, daciurch gekennzeichnet, dafl 
bei- der Synchronisation durch einen Trigger ein 

konf igurierbares Element zur Ausftihrung einer einzigen 
Operation angeregt werden kann. 

3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dafl 
bei der Synchronisation durch einen Trigger ein 

konf igurierbares Element zur Ausftihrung einer Vielzahl 
Operation angeregt werden kann. . 

4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dafl 
bei der Synchronisation durch einen Trigger die Ausftihrung 
eines konf igurierbaren Elements angehalten werden kann. 

5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dafl 
bei der Synchronisation durch einen Trigger ein 

konf igurierbares Element zur Umkonf iguration freigegeben werden 
kann. 

6. Verfahren nach Anspruch 1-5, dadurch gekennzeichnet, dafl 
das konfigurierbare Element seinen momentanen Status in einem 
Statusregister anzeigt. 

7. Verfahren nach Anspruch 1-6, dadurch gekennzeichnet, dafl 
die Angabe der anzusteuernden Register in Befehlen kodiert ist 
und tiber den Datenbus ubertragen wird. 
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8. Verfahren nach Anspruch 1-7, dadurch gekennzeichnet, dafl 
die Synchronisationssignale zum Empfanger der Daten, zum Sender 
der Daten Oder zu einem unabhangigen konf igurierbare.n Element 
tibertragen werden. 

9. Verfahren nach Anspruch 1-8, dadurch gekennzeichnet, daii 
die Obertragung der Synchronisationssignale gesperrt werden 
kann. 

1C. Verfahren nach Anspruch 1-9, dadurch gekennzeichnet, dafl 
unterschiedliche Synchronisationssignale wahlweise tibertragen 
werden (Vergleich, Fehlerzustande, etc.), wobei die Art des ' 
Synchronistaionssignales frei in der generierenden Einheit 
wahlbar ist und die Auswirkung der Synchronisationssignale frex 
in der empfangenden Einheit wahlbar ist. 

11. Verfahren nach Anspruch 1-10, dadurch gekennzeichnet, da£ 
ein Synchronisationssignal an mehrere Empfanger tibertragen 
werden kann. 

12. Verfahren nach Anspruch 1-11, dadurch gekennzeichnet, daft 
einem Synchronisationssignal eine Quittierungsleitung 
zugeordnet ist. 

13. Verfahren nach Anspruch 1-12, dadurch gekennzeichnet, daB 
ein Synchronisationsvektor aus einem oder einer Mehrzahl von 
Synchronisationssignalen aufgebaut ist. 
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14. Verfahren nach Anspruch 1-13/ dadurch gekennzeichnet, dafi 
ein Konf igurationsregister aus einer Mehrzahl von 
Kcnfigurationsregistern durch einen Synchronisationsvektor 
ausgewahlt wird; bzw. ein Bef ehlsregister aus einer Mehrzahl 
von Befehlsregistern ausgew&hlt wird. 

15 ♦ Verfahren nach Anspruch 1-14, dadurch gekennzeichnet/ dafl 
der Auswahlvorgang eines Registers durch 
Synchronisationssignale so mit der Datenverarbeitung 
synchronisiert wird r daiJ kein Takzyklus verlorengeht . 

16. Verfahren nach Anspruch 1-15, dadurch gekennzeichnet, dafl 
in einem einer Operation zugeordneten Register, ausgewahlt aus 
einer Mehrzahl an Registern, der Wert des generierten 
Synchronisationssignals so gespeichert wird, da£ eine andere 
zugeordnete Operation selektiv darauf zugreifen kann und anhand 
der Information einen mdglichen und gultigen Befehl / eine 
mfcgliche und gilltige Konf iguration aus einer Mehrzahl von 
Bef ehlen/Konf igurationen ausw&hlt . 



42 



WO 98/35299 PCT/DE98/00334 

- 1/11 - 




0 



WO 98/35299 



PCT/DE98/00334 



- 2/11 - 



(N 




WO 98/35299 



PCTVDE98/00334 



- 3/11 - 




tr 



WO 98/35299 



PCT/DE98/00334 



- 4/11 - 




WO 98/35299 



PCT/DE98/00334 



- 5/11 - 



o ^ =— 

0) o>J2 s 



O s =- 

7: CD CO cO 

CO 2 eg <P 

CD D> jg = 



<3 

IT) 



^ O CO CO 
CO " ^ 



JjJ 0) CO CO 

S 3 "a I 

CO S w <p 




WO 98/35299 



PCT/DE98/00334 



- 6/11 - 



3 S » of 
aj £ eg o 

© O) © = 



S 1 . 5 1 

O m CO D 
CO £ Cg 0) 



Q) O) <D s 



o 

go 

LL 



(0 

To 
Q 



5 8 

(0 Q> 

O Z 

(0 o 

<D C 



O 
O 



CO 

5 



o 

U. 



CO 




(0 

To 

Q 



o 
m 
o 



in 




WO 98/35299 



PCT/DE98/00334 



- 7/11 - 



Si** g 

co 2 » © 



O 
Z 



Q 



C - - "D 

ts m 



2 « 



tv * *— X; w 



o 

O 



75 

5 



S £ 5 § 

co ir eg © 







co 




o 


o 


d 


J 


5° 

u_ 


in 
o 




+ 

CO 

co 



r- s 

° 0) 

O 4-* 

co o 



za, 



i 2 
> .» 

E © 

r- d 

— 1 5 
o 

IT) 

o 



in 




CM 

+ 
>*— » 

CO 

CO 

o 



WO 98/35299 



PCT/DE98/00334 



- 8/11 - 



(0 £ » © 

© p>m> » 



o 
u. 



+ 



o 
m 
o 



+ I 
*■» C 

> °> 

s » 
5 



C =-^2 _ 

CO 2 CO 0) 
CD O ® = 



3 
O 



O 
u. 



CM 
+ 

i 

a 



o *- ^ — 
0) O) Q> = 



CO 

o 
m 
o 



CO 

CVI 3 

o sa 
cc o 

> 



o 



T_3 



O c 5- 
0) (0 (0 



O 

z o 

3 



CM 
+ 

I 

Q 



O 

in 
© 



© 

IT) 

o 



I? 



c 
o 


ss" 




J2 




6 


o 




z co 


co 


o 




CD 


c 

s 


U. 



^ CO 
CO 3 
+ O* 

>=° 

(5 .52 
DC o 

H 1 



LU 
O 



o 
o 



CO 

+ 

CO 

« 
Q 



m 
o 
m 
o 




co o) 

CD = 



WO 98/35299 



PCT/DE98/00334 



- 9/11 - 



(N m 



o 



/ 3090 V 



On 


On 


On 


O 


O 


O 








O 


O 


O 



o 
o 




WO 98/35299 



PCT/DE98/00334 



CO 

T— I 

VO" 

o 



VO" 

o 



VO 
O 



VO 
O 



- 10/11 - 





V 



A 



a 





VO 



VO 

o 



VO 
O 



vo 
O 



WO 9835299 



PCT/DE98/00334 



- 11/11 - 




c 




CM 




O) 




o 




\ 




\ 7 










CM 




c 


o 




unc 


unc 




unc 


o 




LL 


u. 







o 
r- 
o 



CM 
O 

o 



oi 

7 



Exec- 


Unit 


4 





*/ £QL0 \ 









o 










o 







o 



CL 

O 



